智能论文笔记

Automatic tracing of mandibular canal pathways using deep learning

Mrinal Kanti Dhar , Zeyun Yu

分类：计算机视觉

2021-11-30

医疗行业的需求越来越多，具有自动化系统，用于检测和定位，否则是手动低效的。在牙科，它非常感兴趣地追踪下颌运河的途径。垂直牙龈神经（IAN）的颌骨运河位置的适当定位降低了在牙科植入术期间损坏其的风险。在时间和劳动中，手工检测运河路径不是有效的方式。在这里，我们提出了一种基于深度学习的框架来检测来自CBCT数据的下颌管。这是一个3级过程全自动端到端。在预处理阶段产生地面真理。我们不是使用常用的固定直径管状的地面真理，而是生成下颌运河的中心线，并在培训过程中使用它们作为地面真理。 3D U-Net架构用于模型培训。开发了一种有效的后处理阶段来纠正初始预测。测量精度，召回，F1分数和IOU分析体素级分割性能。然而，为了分析基于距离的测量，计算从地面真理到预测和预测地面真理的平均曲线距离（MCD）。进行广泛的实验以证明模型的有效性。

translated by 谷歌翻译

Pipeline-Invariant Representation Learning for Neuroimaging

Xinhui Li , Alex Fedorov , Mrinal Mathur , Anees Abrol , Gregory Kiar , Sergey Plis , Vince Calhoun

分类：机器学习

2022-08-27

深度学习已被广泛应用于神经影像学，包括预测磁共振成像（MRI）体积的脑表型关系。 MRI数据通常需要进行广泛的预处理，然后才能通过深度学习准备建模，部分原因是其高维和异质性。各种MRI预处理管道都有自己的优势和局限性。最近的研究表明，即使使用相同的数据，与管道相关的变化也可能导致不同的科学发现。同时，机器学习社区强调了从以模型为中心转移到以数据为中心的方法的重要性，因为数据质量在深度学习应用中起着至关重要的作用。在这个想法的激励下，我们首先评估预处理管道选择如何影响监督学习模型的下游表现。接下来，我们提出了两个管道不变表示方法MPSL和PXL，以提高分类性能的一致性并捕获管道对之间的类似神经网络表示。使用来自英国生物库数据集的2000名人类受试者，我们证明了这两种模型都具有独特的优势，特别是可以使用MPSL来改善对新管道的样本概括，而PXL则可以用来提高预测性能一致性和代表性封闭管道集中的相似性。这些结果表明，我们提出的模型可用于克服与管道相关的偏差，并提高神经成像预测任务的可重复性。

translated by 谷歌翻译

Real-time Caller Intent Detection In Human-Human Customer Support Spoken Conversations

Mrinal Rawat , Victor Barres

分类：人工智能

2022-08-14

在人类人类客户支持语音互动期间的代理协助需要根据呼叫者的意图触发工作流程（通话原因）。预测的及时性对于良好的用户体验至关重要。目的是使系统在代理商能够检测到它时检测呼叫者的意图（意图边界）。一些方法着重于预测离线输出，即，一旦ASR系统处理了完整的口语输入（例如，整个对话转弯）。每当在转弯中早些时候可以检测到意图时，这会引入预测中的不良延迟。关于语音助手的最新工作已在单词层面上使用增量实时预测，以在命令结束之前检测意图。但是，人指导和机器指导的语音具有截然不同的特征。在这项工作中，我们建议将一种在语音辅助方面开发的方法应用于在线实时呼叫者在人类口语互动中的意图检测问题。我们使用双重体系结构，其中两个LSTM共同训练：一个预测意图边界（IB），然后预测IB处的意图类别。我们在私人数据集上进行实验，其中包括来自电信客户支持域的人类电话交谈的成绩单。我们报告结果分析了系统的准确性以及不同体系结构对整体准确性和预测潜伏期之间的权衡的影响。

translated by 谷歌翻译

JU_NLP at HinglishEval: Quality Evaluation of the Low-Resource Code-Mixed Hinglish Text

Prantik Guha , Rudra Dhar , Dipankar Das

分类：自然语言处理

2022-06-16

在本文中，我们介绍了一项针对INLG 2022代挑战（Genchal）提交的系统，该系统涉及对合成的质量评估合成生成的代码混合的Hinglish文本的质量评估。我们实施了基于BISTM的神经网络模型，以预测合成Hinglish数据集的平均评分评分和分歧分数。在我们的模型中，我们将单词嵌入式用于英语和印地语数据，以及用于Hinglish Data的热门编码。我们在平均评分评分预测任务中达到了0.11的F1分数，平均平方误差为6.0。在分歧分数预测的任务中，我们的F1得分为0.18，平均误差为5.0。

translated by 谷歌翻译

Multimodal Hate Speech Detection from Bengali Memes and Texts

Md. Rezaul Karim , Sumon Kanti Dey , Tanhim Islam , Md. Shajalal , Bharathi Raja Chakravarthi

分类：自然语言处理 | 人工智能

2022-04-19

Numerous machine learning (ML) and deep learning (DL)-based approaches have been proposed to utilize textual data from social media for anti-social behavior analysis like cyberbullying, fake news detection, and identification of hate speech mainly for highly-resourced languages such as English. However, despite having a lot of diversity and millions of native speakers, some languages like Bengali are under-resourced, which is due to a lack of computational resources for natural language processing (NLP). Similar to other languages, Bengali social media contents also include images along with texts (e.g., multimodal memes are posted by embedding short texts into images on Facebook). Therefore, only the textual data is not enough to judge them since images might give extra context to make a proper judgement. This paper is about hate speech detection from multimodal Bengali memes and texts. We prepared the only multimodal hate speech dataset for-a-kind of problem for Bengali, which we use to train state-of-the-art neural architectures (e.g., Bi-LSTM/Conv-LSTM with word embeddings, ConvNets + pre-trained language models, e.g., monolingual Bangla BERT, multilingual BERT-cased/uncased, and XLM-RoBERTa) to jointly analyze textual and visual information for hate speech detection. Conv-LSTM and XLM-RoBERTa models performed best for texts, yielding F1 scores of 0.78 and 0.82, respectively. As of memes, ResNet-152 and DenseNet-161 models yield F1 scores of 0.78 and 0.79, respectively. As for multimodal fusion, XLM-RoBERTa + DenseNet-161 performed the best, yielding an F1 score of 0.83. Our study suggests that text modality is most useful for hate speech detection, while memes are moderately useful.

translated by 谷歌翻译

Configuration Space Decomposition for Scalable Proxy Collision Checking in Robot Planning and Control

Mrinal Verghese , Nikhil Das , Yuheng Zhi , Michael Yip

分类：机器人

2022-01-12

复杂高维环境中的实时机器人运动规划仍然是一个开放的问题。运动规划算法及其底层碰撞检查对于任何机器人控制堆栈至关重要。碰撞检查在机器人运动规划中占据了大部分计算时间。现有的碰撞检查器在速度和准确性之间进行权衡，并在高维，复杂的环境中规模不佳。我们在前向运动空间中介绍了一种新的空间分解方法，用于加速代理碰撞检查。我们使用FASTRON，在这些分解的子空间上培训各个配置空间模型，即在这些分解的子空间上，产生轻量级但高度准确的模型，可以快速查询，并更好地缩放到更复杂的环境。我们展示了这种新方法，称为分解的快速Perceptron（D-Fastron），在7-Dof Baxter机器人上，平均撞击碰撞检查和高达9.8倍的运动规划相比，与最先进的几何碰撞检查器相比，更快的运动规划。

translated by 谷歌翻译

Systematic biases when using deep neural networks for annotating large catalogs of astronomical images

Sanchari Dhar , Lior Shamir

分类：计算机视觉 | 机器学习

2022-01-10

由于其非参数性，性能良好，性能良好，并且通过诸如TensorFlow等库的可访问性，深度卷积神经网络（DCNNS）已成为自动图像注释的最常见解决方案。在其他领域中，DCNN也是通过数字天空调查获取的大天文图像数据库的常用方法。 DCNN的主要缺点之一是复杂的非直观规则，使DCNNS成为“黑匣子”，以不清楚用户的方式提供注释。因此，用户通常无法知道什么信息DCNN用于分类。在这里，我们证明了DCNN的训练对培训数据的背景敏感，例如天空中的物体的位置。我们表明，对于椭圆形和螺旋星系的基本分类，用于训练的星系的天空位置影响算法的行为，并导致小但一致而且统计学上的偏差。该偏差在宇宙学级各向异性的形式中表现出基本的星系形态的分布。因此，虽然DCNN是用于注释延长源图像的强大工具，但是对于Galaxy形态的培训集的构建应该考虑到比OB的视觉外观更多的方面ject。在任何情况下，使用深度神经网络创建的目录，即表现出宇宙主义各向异性的迹象，应通过一致偏差的可能性来解释。

translated by 谷歌翻译

EyePAD++: A Distillation-based approach for joint Eye Authentication and Presentation Attack Detection using Periocular Images

Prithviraj Dhar , Amit Kumar , Kirsten Kaplan , Khushi Gupta , Rakesh Ranjan , Rama Chellappa

分类：计算机视觉

2021-12-22

针对边缘设备的实用眼睛认证（EA）系统需要对呈现攻击进行身份验证并强大，同时剩余计算和延迟效率。然而，现有的基于眼框架A）独立地执行认证和呈现攻击检测（PAD），B）涉及提取虹膜区域的显着预处理步骤。在这里，我们使用围绕图像介绍EA和垫的联合框架。虽然深度多任务学习（MTL）网络可以执行任务，但由于EA和焊盘的训练数据集是不相交的，因此MTL遭受遗忘效果。为了克服这一点，我们提出了用垫（眼部）的眼睛认证，一种基于蒸馏的方法，该方法为EA和垫训练了一个网络，同时降低了遗忘的效果。为了进一步提高EA性能，我们介绍了一种名为Eyepad ++的新方法，包括在EA和焊盘数据上训练MTL网络，同时通过额外的蒸馏步骤蒸馏眼网网络的“通用性”。我们所提出的方法优于垫中的SOTA，并在眼睛验证中获得近的SOTA性能，而无需任何预处理。我们还展示了眼部和眼部++在用户到用户验证中的疗效，跨网络骨干网和图像质量。

translated by 谷歌翻译

Distill and De-bias: Mitigating Bias in Face Recognition using Knowledge Distillation

Prithviraj Dhar , Joshua Gleason , Aniket Roy , Carlos D. Castillo , P. Jonathon Phillips , Rama Chellappa

分类：计算机视觉

2021-12-17

面部识别网络通常展示相对于性别，Skintone等的敏感属性，适用于性别和Skintone，我们观察到网络的面积，网络参加属性的类别。这可能有助于偏见。在这种直觉上建立一种新的基于蒸馏的方法，称为蒸馏和去偏置（D＆D），以实施网络以寻求类似的面部区域，而不管属性类别如何。在D＆D中，我们从一个属性中培训一类图像的教师网络;例如轻的Skintone。然后从教师蒸馏信息，我们在剩余类别的图像上培训学生网络;例如，黑暗的skintone。特征级蒸馏损失约束学生网络以生成类似教师的表示。这允许学生网络参加所有属性类别的类似面部区域，并使其能够减少偏差。我们还提出了D＆D的顶部的第二蒸馏步骤，称为D＆D ++。对于D＆D ++网络，我们将D＆D网络的“未偏见”蒸馏成新的学生网络，D＆D ++网络。我们在所有属性类别上培训新网络;例如，光明和黑暗的碳酸根。这有助于我们培训对属性偏差的网络，同时获得比D＆D更高的面部验证性能。我们展示D＆D ++优于在IJB-C数据集上减少性别和Skintone偏置的现有基线，同时获得比现有的对抗偏置方法更高的面部验证性能。我们评估我们所提出的方法对两个最先进的面部识别网络的有效性：Crystalface和Arcface。

translated by 谷歌翻译

Automated Evidence Collection for Fake News Detection

Mrinal Rawat , Diptesh Kanojia

分类：自然语言处理

2021-12-13

社交媒体平台上的假新闻，误导和无法验证的事实宣传了不和谐，影响社会，特别是在处理像Covid-19这样的流行病时。假新闻检测的任务旨在通过将新闻项目分类为假或真实的新闻项目来解决这种错误信息的影响。在本文中，我们提出了一种新的方法，通过自动收集每个索赔的证据来改善目前的自动自动假新闻检测方法。我们的方法从Web艺术品中提取支持证据，然后选择待视为证据组的适当文本。我们在这些证据组上使用预先训练的摘要，然后使用提取的摘要作为支持证据来帮助分类任务。我们的实验，使用机器学习和基于深度学习的方法，有助于对我们的方法进行广泛的评估。结果表明，我们的方法优于假新闻检测中的最先进方法，以在为约束-2021共享任务提供的数据集中实现99.25的F1分数。我们还释放了任何进一步研究的增强数据集，我们的代码和模型。

translated by 谷歌翻译